AI 正在“上岸”:一次关于落地、进阶与趋势的集体答卷
5 月 23~24 日,由极客邦科技旗下 InfoQ 中国主办的AICon 全球人工智能开发与应用大会·上海站(2025)圆满落幕。大会吸引了超 800 位 AI 开发者、技术专家与相关从业者齐聚一堂,现场氛围高涨,技术交流深入务实。
5 月 23~24 日,由极客邦科技旗下 InfoQ 中国主办的AICon 全球人工智能开发与应用大会·上海站(2025)圆满落幕。大会吸引了超 800 位 AI 开发者、技术专家与相关从业者齐聚一堂,现场氛围高涨,技术交流深入务实。
中国人工智能产业的一大特点是注重性能极致优化,不靠堆叠资源,而是不断从技术细节入手,从大语言模型到具体环节应用,都涌现出一批卓越表现的企业。本次参展的WaveSpeedAI,正是一家致力于为多模态AI引擎“提速降费”的创新公司。
模态 beyond expo wavespeedai 东方哲 2025-05-25 00:39 8
Ollama-OCR是一个Python的OCR解析库,结合了Ollama的模型能力,可以直接处理 PDF 文件无需额外转换,轻松从扫描版或原生PDF文档中提取文本和数据。根据使用的视觉模型和自定义提示词,Ollama-OCR可支持多种语言,并且能把文档转换为特
不止于此,其最新融合的多模态模型BAGEL主打一个“大一统”, 将带图推理、图像编辑、3D生成等功能全都集中到了一个模型。
中国人工智能产业的一大特点是注重性能极致优化,不靠堆叠资源,而是不断从技术细节入手,从大语言模型到具体环节应用,都涌现出一批卓越表现的企业。本次参展的WaveSpeedAI,正是一家致力于为多模态AI引擎“提速降费”的创新公司。
模态 beyond expo wavespeedai 东方哲 2025-05-24 10:46 9
你是否有过这样的体验?出门旅行,打开小红书查攻略、跳到美团比酒店、再去飞猪比价格,担心踩雷还得刷抖音、快手看实拍视频。不同APP之间来回切换,短信验证码刷个不停,信息倒是查了一堆,真正有用的却寥寥无几。
该工作由字节跳动 ByteBrain 团队 × 清华大学合作完成。第一作者为清华大学三年级博士生谢哲,主要研究方向为时序多模态 LLM、异常检测和根因定位。第二作者和第三作者分别为李则言和何晓,均来自字节跳动。通讯作者分别为字节跳动研究科学家张铁赢和清华大学计
智象未来团队提出全新层级自回归生成范式 Hierarchical Masked Autoregressive models (Hi-MAR),有效解决自回归图像生成中结构失真问题。该研究已被 ICML 2025 收录,并在多个图像生成任务中取得领先性能。
在图像生成技术的最新进展中,智象未来团队提出了一种名为Hi-MAR(Hierarchical Masked Autoregressive models)的创新层级自回归生成范式,这一成果成功吸引了国际机器学习会议ICML 2025的青睐,并被正式收录。Hi-M
人工智能(AI)技术作为21世纪最具变革性的技术之一,正以前所未有的速度重塑人类社会。从智能手机中的语音助手到工厂里的智能机器人,从医疗诊断系统到金融风控模型,AI技术已渗透到我们生活和工作的方方面面。本文将深度解析创新性人工智能技术的核心原理、最新进展、应用
“模型迭代这么快,能力越来越强,基于大模型开发的应用会不会很快就过时,没价值了?”这是许多AI开发者内心的焦虑。在今年4月的Create 2025百度AI开发者大会上,李彦宏直接点出了这个行业痛点。
国家知识产权局信息显示,鄂尔多斯市腾远煤炭有限责任公司、武汉大学取得一项名为“一种基于多模态深度学习的矿山边坡风险预测方法”的专利,授权公告号CN119539481B,申请日期为2024年11月。
OpenAI日前宣布以65亿美元全股收购由苹果前首席设计师JonyIve创立的AI硬件初创公司io,并计划推出一款革命性的AI“伴侣”设备,目标在2026年底前发货1亿台。这款设备旨在成为一款环境感知智能体,可放置在口袋或书桌上,通过多模态AI(结合语音、视觉
在科技行业的浩瀚星空中,一系列闪耀的上市公司构成了数字经济的璀璨星河,其中包括阿里巴巴(09988.HK,BABA.US)、百度(09888.HK,BIDU.US)、腾讯(00700.HK, TCEHY)等科技巨头,以及科大讯飞(002230.SZ)、万兴科技
行业主要上市公司:阿里巴巴 ( 09988.HK,BABA.US ) ; 百度 ( 09888.HK,BIDU.US ) ; 腾讯 ( 00700.HK, TCEHY ) ;科大讯飞 ( 002230.SZ ) ;万兴科技 ( 300624.SZ ) ;三六零
文心X1 Turbo在24项能力评估中,16项达5分、7项达4分、1项达3分,综合评级获当前最高级“4+级”。
该工作由字节跳动 ByteBrain 团队 × 清华大学合作完成。第一作者为清华大学三年级博士生谢哲,主要研究方向为时序多模态 LLM、异常检测和根因定位。第二作者和第三作者分别为李则言和何晓,均来自字节跳动。通讯作者分别为字节跳动研究科学家张铁赢和清华大学计
该工作由字节跳动 ByteBrAIn 团队 × 清华大学合作完成。第一作者为清华大学三年级博士生谢哲,主要研究方向为时序多模态 LLM、异常检测和根因定位。第二作者和第三作者分别为李则言和何晓,均来自字节跳动。通讯作者分别为字节跳动研究科学家张铁赢和清华大学计
近年来,大型语言模型(LLM)在多模态任务中展现出强大潜力,但现有模型在架构统一性与后训练(Post-Training)方法上仍面临显著挑战。
模型 模态 mmada 模型mmada geminidiff 2025-05-22 18:49 10
在临床中我们发现,大部分中老年缺牙朋友在生活中备受缺牙困扰,即使对种植牙修复的技术和优势非常认可,但却难以跨过“心理关”,难以克服内心对疼痛的恐惧和害怕。可恩口腔“0度”无痛种植牙技术的出现则帮助诸多如王阿姨一般的朋友实现轻松种牙,畅享品质生活。